رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی lda

Authors

بابک مسعودی

دانشگاه پیام نور سعید راحتی

saeid rahati ghochani مشهد دانشگاه آزاد اسلامی

abstract

ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله(lda) برای این منظور استفاده کرده ایم. نتایج آزمایشات برای چهار واژه مبهم پر تکرار در زبان فارسی که ازپیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقّت حدود 97.67% را نشان می دهد که بیان گر مؤثر بودن این روش در یافتن معنی مناسب واژگان مبهم است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA

Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...

full text

سامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالب‌های معنایی

رفع ابهام معنایی از کلمات در بافت یکی از مهم‌ترین چالش‌ها در حوزۀ پردازش زبان طبیعی و زبان‌شناسی رایانشی است. در این میان حروف اضافه، به‌خصوص در زبان فارسی، در پژوهش‌های مربوط به رفع ابهام معنایی همواره نادیده انگاشته شده‌اند. ازاین‌رو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالب‌های معنایی، سامانه‌ای قاعده‌مند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فار...

full text

تحلیل معنایی واژگان مرکب مفعولی در زبان فارسی

       در مقالة حاضر با گردآوری 745 واژة مرکب مفعولی به تحلیل معنایی این دسته از واژگان مرکب نحوی می‌پردازیم. در ارتباط با نقش بیرونی کلمات مرکب مفعولی می‌توان به تعمیمی‌ دست یافت؛ بدین ترتیب که به طور عمده در طبقة صفات قرار می‌گیرند، هر چند تعدادی اسم نیز در این میان مشاهده می‌شود. همچنین بررسی معنایی واژگان مرکب مفعولی حاکی از آن است که این دسته از واژگان از دلالت برون‌زبانی (مصداقی) برخوردار...

full text

بررسی تحول معنایی واژگان دخیل عربی در زبان فارسی.

چکیده: در این مقاله به بررسی تغییر و تحولات واژگان دخیل عربی که در فرهنگ بزرگ سخن بسیاری از آن‌ها ذکر شده‌اند، پرداخته‌ایم. این تغییرات در سطح معنایی توصیف و طبقه‌بندی می‌شود. در حین این انتقال، تعداد زیادی از واژگان عربی با مدلول‌های اصلی و اولیة خود در زبان عربی، وارد زبان فارسی شده و در زبان مردم جاری و ساری گشته‌اند؛ اما معنا و مدلول اولیة خود را از دست داده و معنای جدیدی گرفته‌اند؛ م...

full text

تحلیل معنایی واژگان زبان فارسی بر مبنای رویکرد معنی‌شناسی قالب‌بنیاد

معنی‌شناسی قالب‌بنیاد نخستین بار از سوی چارلز فیلمور و پس از طرح مفهوم «قالب» از سوی او (1977الف، 1977ب، 1985، 1987) به‌مثابۀ نگرشی در چهارچوب معنی‌شناسی شناختی مطرح شد. فیلمور در این رویکرد واژگانی، اصطلاح «قالب» را به‌مثابۀ شیوه‌ای برای تحلیل‌های معنایی زبان طبیعی به کار می‌برد. نگارندۀ نوشتۀ حاضر با استفاده از نمونه‌های متعددی از زبان فارسی معیار به ارزیابی میزان کارایی این نظریه در زبان فار...

full text

بررسی جایگاه واژگان مصوبِ فرهنگستان زبان و ادب فارسی در فهرست سرعنوان‌های موضوعی فارسی

فرهنگستان زبان و ادب فارسی، به عنوان مرجعی ملی و معتبر در زمینه معادل­یابیِ واژگان بیگانه، ضمن انتشار فهرستی از واژگان مصوب فرهنگستان، به منظور رفع تشتّت و ایجاد هماهنگى در فعالیت‌هاى مراکز فرهنگى و پژوهشى در حوزۀ زبان و ادب فارسى، کلیه سازمان­های دولتی را به پیروی و استفاده از واژگان یادشده فراخوانده است. در این بین، نقش کتابخانه ملی، نَه صرفاً به عنوان کتابخانه مادر، که به دلیل نقشی که در تدوین و...

full text

My Resources

Save resource for easier access later


Journal title:
پردازش علائم و داده ها

جلد ۱۲، شماره ۴، صفحات ۱۱۷-۱۲۵

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023